Curva ROC

Terminología y sus derivados
a partir de una matriz de confusión ladeada. [1]
Verdaderos Positivos (VP)
o también éxitos
Verdaderos Negativos (VN)
o también rechazos correctos
Falsos Positivos (FP)
o también falsas alarmas o Error tipo I
Falsos Negativos (FN)
o también, Error de tipo II
Sensibilidad o Razón de Verdaderos Positivos (VPR)
o también razón de éxitos y, recuerdo en recuperación de información,
Ratio o Razón de Falsos Positivos (FPR)
o también razón de falsas alarmas o fall-out en recuperación de información
Exactitud (accuracy) (ACC)
Especificidad (SPC) o Razón de Verdaderos Negativos
Valor Predictivo Positivo (PPV)
o también "precisión" en recuperación de información
Valor Predictivo Negativo (NPV)
Ratio o Razón de Falsos Descubrimientos (FDR)
Valor-F o F1 es la media armónica entre la precisión y la sensibilidad

En la teoría de detección de señales, una curva ROC (acrónimo de Receiver Operating Characteristic, o Característica Operativa del Receptor) es una representación gráfica de la sensibilidad frente a la razón de falsas alarmas (1-especificidad) para un sistema clasificador binario según se varía el umbral de discriminación. Otra interpretación de este gráfico es la representación de la razón o proporción de verdaderos positivos (VPR = Razón de Verdaderos Positivos) frente a la razón o proporción de falsos positivos (FPR = Razón de Falsos Positivos) también según se varía el umbral de discriminación (valor a partir del cual decidimos que un caso es un positivo). ROC también puede significar Relative Operating Characteristic (Característica Operativa Relativa) porque es una comparación de dos características operativas (VPR y FPR) según cambiamos el umbral para la decisión. En español es preferible mantener el acrónimo inglés, aunque es posible encontrar el equivalente español COR. No se suele utilizar ROC aislado, debemos decir “curva ROC” o “análisis ROC”. Sobre la historia del acrónimo ROC consultar Swets (1996).[2]

El análisis de la curva ROC, o simplemente análisis ROC, proporciona herramientas para seleccionar los modelos posiblemente óptimos y descartar modelos subóptimos independientemente de (y antes de especificar) el coste de la distribución de las dos clases sobre las que se decide. La curva ROC es también independiente de la distribución de las clases en la población (en diagnóstico, la prevalencia de una enfermedad en la población). El análisis ROC se relaciona de forma directa y natural con el análisis de coste/beneficio en toma de decisiones diagnósticas.

La curva ROC se desarrolló por ingenieros eléctricos para medir la eficacia en la detección de objetos enemigos en campos de batalla mediante pantallas de radar, a partir de lo cual se desarrolla la Teoría de Detección de Señales (TDS). El análisis ROC se aplicó posteriormente en medicina, radiología, psicología y otras áreas durante varias décadas. Solo recientemente ha encontrado aplicación en áreas como aprendizaje automático (o machine learning en inglés), y minería de datos (data mining en inglés).

  1. «Fawcett T. ROC Graphs: Notes and Practical Considerations for Researchers. Technical report. Palo Alto (USA): HP Laboratories; (2004).». Archivado desde el original el 14 de octubre de 2008. Consultado el 15 de septiembre de 2009. 
  2. Signal detection theory and ROC analysis in psychology and diagnostics: collected papers; Swets, 1996

© MMXXIII Rich X Search. We shall prevail. All rights reserved. Rich X Search